Recherche de sous-structures fréquentes pour l'intégration de schémas XML
نویسندگان
چکیده
Résumé. La recherche d’un schéma médiateur à partir d’un ensemble de schémas XML est une problématique actuelle où les résultats de recherche issus de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte, plusieurs propositions ont été réalisées mais les méthodes de représentation des arborescences sont souvent trop coûteuses pour permettre un véritable passage à l’échelle. Dans cet article, nous proposons des algorithmes de recherche de sous-schémas fréquents basés sur une méthode originale de représentation de schémas XML. Nous décrivons brièvement la structure adoptée pour ensuite détailler les algorithmes de recherche de sous-arbres fréquents s’appuyant sur une telle structure. La représentation proposée et les algorithmes associés ont été évalués sur différentes bases synthétiques de schémas XML montrant ainsi l’intérêt de l’approche proposée.
منابع مشابه
Une représentation des arborescences pour la recherche de sous-structures fréquentes
Résumé. La recherche de structures fréquentes au sein de données arborescentes est une problématique actuellement très active qui trouve de nombreux intérêts dans le contexte de la fouille de données comme, par exemple, la construction automatique d’un schéma médiateur à partir de schémas XML. Dans ce contexte, de nombreuses propositions ont été réalisées mais les méthodes de représentation des...
متن کاملModélisation de la cognition sociale - Propositions autour de l'utilisation de schémas cognitifs
Ce travail de recherche est fondé sur une approche multidisciplinaire, comprenant les systèmes multi-agents utilisés pour modéliser des organisations et les interactions entre des acteurs organisationnels, les cartes cognitives pour représenter les croyances des agents artificiels et des schémas pour modéliser des structures cognitives de haut niveau. Cette recherche est fondée sur la reconnais...
متن کاملIntégration de sources hétérogènes par matching semi-automatique de schémas XML étendus
RÉSUMÉ. Lors de l’intégration de sources de données hétérogènes, une des tâches les plus importantes est la transformation (semi-)automatique de ces sources par une phase de recherche de correspondances appelée schema matching. Le but de cet article est de proposer une solution lors de la phase de matching entre des schémas XML étendus appelés EXS (Enhanced XML Schemas). L’ensemble des schémas ...
متن کاملMéthodologie de Matching à large Echelle de schémas XML
RÉSUMÉ. Le matching, est une opération importante pour les processus assurant l’interopérabilité de systèmes d’information notamment pour des applications telles que l'échange, l'intégration et la transformation de données. Toutefois, la problématique du matching se pose avec acuité lorsque le nombre et le volume des schémas de données est important. C’est notamment le cas pour les applications...
متن کاملComparaison de critères de pureté pour l'intégration de connaissances en clustering semi-supervisé
Résumé. L’utilisation de connaissances pour améliorer les processus de fouille de données a mobilisé un important effort de recherche ces dernières années. Il est cependant souvent difficile de formaliser ce type de connaissances, comme celles-ci sont souvent dépendantes du domaine. Dans cet article, nous nous intéressons à l’intégration de connaissances sous la forme d’objets étiquetés dans le...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2006